روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

نویسندگان

فاطمه فتحی نژاد

fateme fathinezhad دانشگاه یزد ولی درهمی

vali derhami دانشگاه یزد

چکیده

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. در این مقاله، یک ایده جدید برای استفاده مؤثّر از هر دو الگوریتم یادگیری فوق ارائه می شود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. روش ترکیبی پیشنهاد شده دو مرحله دارد. در مرحله اول، داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزش هر عمل کاندید در قواعد فازی با کمک داده های آموزشی مقدار دهی اولیه می شوند. در مرحله دوم از الگوریتم سارسای فازی برای تنظیم دقیق تر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیه ساز kiks برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری، تعداد شکست ها، و کیفیت حرکت ربات می باشد.

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات

استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...

15 صفحه اول

استخراج ویژگی‌ از داده‌های عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخ‌دار

این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات‌ چرخ‌دار در زمین‌های هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه می‌نماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش‌ اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگی‌های مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر می‌باشد. برای این منظور در این مقاله...

متن کامل

یادگیری تقویتی برای ربات های فوتبالیست

مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...

ارائه روشی نوین مبتنی بر یادگیری تقویتی برای تعیین ساختار در شناسایی سیستم ها

ساختارها و مدل های دارای دینامیک متغیر و نحوه تعیین ساختار آنها به خصوص در حالت برخط طی سال های اخیر به منظور توسعه و بهبود روش های شناسایی سیستم ها مورد توجه قرار گرفته اند. در این پایان نامه روشی نوین مبتنی بر الگوریتم های انتخاب عمل و پاداش دهی در یادگیری تقویتی برای تعیین ساختار در شناسایی سیستم ها ارائه شده است. قابلیت تعیین ساختار به صورت افزایشی یکی از ویژگی های بارز الگوریتم ارائه شده ا...

روشی جدید برای محاسبه‌ی ناحیه‌ی پایداری ربات انسان‌نما

مهم‌ترین نکته در راه رفتن ربات‌های انسان‌نما، حفظ تعادل است. مطالعات گسترده‌یی که تاکنون در این زمینه صورت گرفته به ارائه‌ی نظریه‌های مرکز جرم(C‌O‌G) و نقطه‌ی صفر گشتاوری (Z‌M‌P)انجامیده است. تعادل ربات اساساً مبتنی‌بر قرارگیری این نقاط در ناحیه‌یی موسوم به ناحیه‌ی پایداری است. در این پژوهش روشی جدید برای به دست آوردن ناحیه‌ی پایداری ارائه شده است. بدین‌منظور ابتدا به‌کمک معادلات تعادل حاکم بر ر...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

عنوان ژورنال:

کنترل

جلد ۶، شماره ۳، صفحات ۱-۱۰

کلمات کلیدی

ناوبری ربات یادگیری باناظر یادگیری تقویتی کنترلگر فازی.

میزبانی شده توسط پلتفرم ابری doprax.com